智能论文笔记

Adherence Forecasting for Guided Internet-Delivered Cognitive Behavioral Therapy: A Minimally Data-Sensitive Approach

Ulysse Côté-Allard , Minh H. Pham , Alexandra K. Schultz , Tine Nordgreen , Jim Torresen

分类：机器学习

2022-01-11

互联网交付的心理治疗（IDPT）被视为一种有效且可扩展的途径，以改善心理医疗保健的可达性。在这种情况下，由于更加传统的干预措施，因此由于医疗保健专业人员与患者之间的互动减少而应对地址的挑战是特别相关的挑战。同时，使用人民个人数据时，尤其是在数字球体中的越来越多的规定。在此类规定中，数据最小化通常是核心租户，例如在一般数据保护条例（GDPR）内。因此，这项工作提出了一种深入学习方法来执行自动遵守预测，同时仅依赖于最敏感的登录/注销数据。该方法在包含接受互联网交付的认知行为治疗（G-ICBT）治疗的342名患者的数据集上进行测试。当仅经过1/3的治疗持续时间，所提出的自我注意网络实现了超过70％的平均平衡准确性。因此，本研究表明，G-ICBT的自动遵守预测，只能使用最小敏感的数据来实现，从而促进了在现实世界IDPT平台中实现了这些工具。

translated by 谷歌翻译

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić , Daniel Hesslow , Roman Castagné , Alexandra Sasha Luccioni , François Yvon , Matthias Gallé

分类：自然语言处理

2022-11-09

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

translated by 谷歌翻译

Learning to diagnose common thorax diseases on chest radiographs from radiology reports in Vietnamese

Thao T. B. Nguyen , Tam M. Vo , Thang V. Nguyen , Hieu H. Pham , Ha Q. Nguyen

分类：计算机视觉

2022-09-11

我们提出了一个数据收集和注释管道，该数据从越南放射学报告中提取信息，以提供胸部X射线（CXR）图像的准确标签。这可以通过注释与其特有诊断类别的数据相匹配，这些数据可能因国家而异。为了评估所提出的标签技术的功效，我们构建了一个包含9,752项研究的CXR数据集，并使用该数据集的子集评估了我们的管道。以F1得分为至少0.9923，评估表明，我们的标签工具在所有类别中都精确而始终如一。构建数据集后，我们训练深度学习模型，以利用从大型公共CXR数据集传输的知识。我们采用各种损失功能来克服不平衡的多标签数据集的诅咒，并使用各种模型体系结构进行实验，以选择提供最佳性能的诅咒。我们的最佳模型（CHEXPERT-FRECTER EDIDENENET-B2）的F1得分为0.6989（95％CI 0.6740，0.7240），AUC为0.7912，敏感性为0.7064，特异性为0.8760，普遍诊断为0.8760。最后，我们证明了我们的粗分类（基于五个特定的异常位置）在基准CHEXPERT数据集上获得了可比的结果（十二个病理），以进行一般异常检测，同时在所有类别的平均表现方面提供更好的性能。

translated by 谷歌翻译

Physics-based Digital Twins for Autonomous Thermal Food Processing: Efficient, Non-intrusive Reduced-order Modeling

Maximilian Kannapinn , Minh Khang Pham , Michael Schäfer

分类：人工智能

2022-09-07

使热处理可控的一种可能的方法是收集有关产品当前状态的实时信息。通常，感觉设备无法轻松或根本捕获所有相关信息。数字双胞胎在实时模拟中使用虚拟探针缩小了这一差距，并与该过程同步。本文提出了一个基于物理的，数据驱动的数字双框架，用于自动食品处理。我们建议使用设备级别可执行的精益数字双胞胎概念，需要最小的计算负载，数据存储和传感器数据要求。这项研究重点是用于热过程的非侵入性降低模型（ROM）的简约实验设计。在训练数据中表面温度的高标准偏差与ROM测试中的均方根误差之间的高标准偏差之间的相关性（$ r = -0.76 $）可以有效地选择训练数据。最佳ROM的平均均方根误差小于代表性测试集的1 kelvin（0.2％平均平均百分比误差）。 SP $ \ $ 1.8E4的仿真速度允许进行设备模型预测控制。拟议的数字双框架旨在适用于行业。通常，一旦在未提供对求解器的根级访问（例如商业仿真软件）中执行该过程的建模，就需要一旦在软件中执行该过程的建模，就需要进行非侵入式降级建模。仅使用一个数据集就可以实现降顺序模型的数据驱动训练，因为使用相关性来预测训练成功。

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

Continual Learning: Fast and Slow

Quang Pham , Chenghao Liu , Steven C. H. Hoi

分类：人工智能 | 计算机视觉 | 机器学习

2022-09-06

根据互补学习系统（CLS）理论〜\ cite {mcclelland1995there}在神经科学中，人类通过两个补充系统有效\ emph {持续学习}：一种快速学习系统，以海马为中心，用于海马，以快速学习细节，个人体验，个人体验，个人体验，个人体验，个人体验，个人体验，个人体验，个人体验的快速学习， ;以及位于新皮层中的缓慢学习系统，以逐步获取有关环境的结构化知识。在该理论的激励下，我们提出\ emph {dualnets}（对于双网络），这是一个一般的持续学习框架，该框架包括一个快速学习系统，用于监督从特定任务和慢速学习系统中的模式分离代表学习，用于表示任务的慢学习系统 - 不可知论的一般代表通过自我监督学习（SSL）。双网符可以无缝地将两种表示类型纳入整体框架中，以促进在深层神经网络中更好地持续学习。通过广泛的实验，我们在各种持续的学习协议上展示了双网络的有希望的结果，从标准离线，任务感知设置到具有挑战性的在线，无任务的场景。值得注意的是，在Ctrl〜 \ Cite {veniat2020202020202020202020202020202020202020202020202020202020202021- coite {ostapenko2021-continual}的基准中。此外，我们进行了全面的消融研究，以验证双nets功效，鲁棒性和可伸缩性。代码可在\ url {https://github.com/phquang/dualnet}上公开获得。

translated by 谷歌翻译

vieCap4H-VLSP 2021: Vietnamese Image Captioning for Healthcare Domain using Swin Transformer and Attention-based LSTM

Thanh Tin Nguyen , Long H. Nguyen , Nhat Truong Pham , Liu Tai Nguyen , Van Huong Do , Hai Nguyen , Ngoc Duy Nguyen

分类：计算机视觉 | 人工智能 | 自然语言处理

2022-09-03

这项研究介绍了我们对越南语言和语音处理任务（VLSP）挑战2021的文本处理任务的医疗保健领域的自动越南图像字幕的方法作为编码器的体系结构和长期的短期内存（LSTM）作为解码器生成句子。这些模型在不同的数据集中表现出色。我们提出的模型还具有编码器和一个解码器，但是我们在编码器中使用了SWIN变压器，LSTM与解码器中的注意模块结合在一起。该研究介绍了我们在比赛期间使用的培训实验和技术。我们的模型在vietcap4h数据集上达到了0.293的BLEU4分数，并且该分数在私人排行榜上排名3 $^{rd} $。我们的代码可以在\ url {https://git.io/jddjm}上找到。

translated by 谷歌翻译

Riesz-Quincunx-UNet Variational Auto-Encoder for Satellite Image Denoising

Duy H. Thai , Xiqi Fei , Minh Tri Le , Andreas Züfle , Konrad Wessels

分类：计算机视觉 | 机器学习

2022-08-25

多分辨率的深度学习方法，例如U-NET体系结构，在分类和分割图像中已经达到了高性能。但是，这些方法不能提供潜在的图像表示形式，也不能用于分解，denoise和重建图像数据。 U-NET和其他卷积神经网络（CNNS）通常使用合并来扩大接受场，这通常会导致不可逆的信息丢失。这项研究建议包括riesz-quincunx（RQ）小波变换，结合1）高阶Riesz小波变换和2）在U-NET体系结构内正交Quincunx小波（两者都用于减少医学图像中的模糊），以减少卫星图像及其时间序列中的噪音。在变换的特征空间中，我们提出了一种变异方法，以了解特征的随机扰动如何影响图像以进一步降低噪声。结合两种方法，我们引入了一种用于减少卫星图像中噪声的图像和时间序列分解的混合Rqunet-VAE方案。我们提出了定性和定量的实验结果，表明与其他最先进的方法相比，我们提出的Rqunet-VAE在降低卫星图像中的噪声方面更有效。我们还将我们的方案应用于多波段卫星图像的多个应用程序，包括：通过扩散和图像分割分解图像denoising，图像和时间序列分解。

translated by 谷歌翻译

Enhancing Deep Learning-based 3-lead ECG Classification with Heartbeat Counting and Demographic Data Integration

Khiem H. Le , Hieu H. Pham , Thao B. T. Nguyen , Tu A. Nguyen , Cuong D. Do

分类：计算机视觉

2022-08-15

如今，越来越多的人被诊断出患有心血管疾病（CVD），这是全球死亡的主要原因。鉴定这些心脏问题的金标准是通过心电图（ECG）。标准的12铅ECG广泛用于临床实践和当前的大多数研究。但是，使用较少的铅可以使ECG更加普遍，因为它可以与便携式或可穿戴设备集成。本文介绍了两种新型技术，以提高当前深度学习系统的3铅ECG分类的性能，从而与使用标准12铅ECG训练的模型相提并论。具体而言，我们提出了一种以心跳回归数量的形式的多任务学习方案，以及将患者人口统计数据整合到系统中的有效机制。随着这两个进步，我们在两个大规模的ECG数据集（即Chapman和CPSC-2018）上以F1分数为0.9796和0.8140的分类性能，这些数据分别超过了当前最新的ECG分类方法，该方法超过了当前的ECG分类方法。甚至那些接受了12条铅数据的培训。为了鼓励进一步开发，我们的源代码可在https://github.com/lhkhiem28/lightx3ecg上公开获得。

translated by 谷歌翻译

Detecting COVID-19 from digitized ECG printouts using 1D convolutional neural networks

Thao Nguyen , Hieu H. Pham , Huy Khiem Le , Anh Tu Nguyen , Ngoc Tien Thanh , Cuong Do

分类：计算机视觉

2022-08-10

COVID-19大流行已经暴露了全球医疗服务的脆弱性，增加了开发新颖的工具来提供快速且具有成本效益的筛查和诊断的需求。临床报告表明，Covid-19感染可能导致心脏损伤，心电图（ECG）可以作为Covid-19的诊断生物标志物。这项研究旨在利用ECG信号自动检测COVID-19。我们提出了一种从ECG纸记录中提取ECG信号的新方法，然后将其送入一维卷积神经网络（1D-CNN）中，以学习和诊断疾病。为了评估数字信号的质量，标记了基于纸张的ECG图像中的R峰。之后，将从每个图像计算的RR间隔与相应数字化信号的RR间隔进行比较。 COVID-19 ECG图像数据集上的实验表明，提出的数字化方法能够正确捕获原始信号，平均绝对误差为28.11 ms。我们提出的1D-CNN模型在数字化的心电图信号上进行了训练，允许准确识别患有COVID-19和其他受试者的个体，分类精度为98.42％，95.63％和98.50％，用于分类COVID-19 vs.正常，与正常人分类， COVID-19与异常心跳和Covid-19和其他类别分别与其他阶级。此外，提出的方法还为多分类任务实现了高级的性能。我们的发现表明，经过数字化的心电图信号训练的深度学习系统可以作为诊断Covid-19的潜在工具。

translated by 谷歌翻译